URL থেকে HTML ফাইল Fetch করা

Java Technologies - জেসুপ (JSoup) - HTML ডকুমেন্ট পার্সিং

170

জেসুপ (JSoup) ব্যবহার করে HTML ফাইল লোড করা অত্যন্ত সহজ। এটি আপনার লোকাল বা রিমোট HTML ফাইলকে পার্স (parse) করতে সাহায্য করে। HTML ফাইল লোড করার জন্য JSoup এর Jsoup.parse() বা Jsoup.parseFile() মেথড ব্যবহার করা হয়।

HTML ফাইল লোড করার জন্য `Jsoup.parseFile()` ব্যবহার

Jsoup.parseFile() মেথড HTML ফাইল লোড করতে ব্যবহৃত হয়, যা আপনার লোকাল ডিরেক্টরি থেকে HTML ফাইল রিড করে এবং এটি একটি Document অবজেক্টে পরিণত করে। এই মেথডটি HTML ফাইলের পাথ নেয় এবং সেটিকে পার্স করে HTML ডকুমেন্ট হিসেবে রিটার্ন করে।

উদাহরণ:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.File;
import java.io.IOException;

public class JsoupExample {
    public static void main(String[] args) {
        try {
            // লোকাল HTML ফাইল লোড করা
            File inputFile = new File("path/to/your/file.html");
            Document doc = Jsoup.parseFile(inputFile, "UTF-8");
            
            // HTML ডকুমেন্টের শিরোনাম প্রিন্ট করা
            System.out.println("Title: " + doc.title());
            
            // HTML ডকুমেন্টের প্রথম h1 ট্যাগ প্রিন্ট করা
            System.out.println("Heading: " + doc.select("h1").first().text());
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

এই কোডে:

Jsoup.parseFile(inputFile, "UTF-8") মেথডটি লোকাল HTML ফাইল পার্স করে।
তারপর doc.title() এবং doc.select("h1").first() ব্যবহার করে HTML ডকুমেন্টের শিরোনাম এবং প্রথম h1 ট্যাগের কনটেন্ট এক্সট্র্যাক্ট করা হয়েছে।

HTML ফাইল লোড করার জন্য `Jsoup.parse()` ব্যবহার

Jsoup.parse() মেথডটি সাধারণত HTML কনটেন্ট স্ট্রিং পার্স করতে ব্যবহৃত হয়, তবে এটি ফাইল থেকেও HTML ডেটা রিড করতে পারে যদি আপনি ফাইলের কনটেন্টকে স্ট্রিং হিসেবে লোড করেন।

উদাহরণ:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.File;
import java.io.IOException;
import java.nio.file.Files;

public class JsoupExample {
    public static void main(String[] args) {
        try {
            // HTML ফাইলের কনটেন্ট স্ট্রিং হিসেবে রিড করা
            File inputFile = new File("path/to/your/file.html");
            String htmlContent = new String(Files.readAllBytes(inputFile.toPath()), "UTF-8");
            
            // HTML কনটেন্ট পার্স করা
            Document doc = Jsoup.parse(htmlContent);
            
            // HTML ডকুমেন্টের শিরোনাম প্রিন্ট করা
            System.out.println("Title: " + doc.title());
            
            // HTML ডকুমেন্টের প্রথম h1 ট্যাগ প্রিন্ট করা
            System.out.println("Heading: " + doc.select("h1").first().text());
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

এখানে:

ফাইলের কনটেন্ট Files.readAllBytes() মেথড দিয়ে স্ট্রিং আকারে রিড করা হয়েছে।
তারপর Jsoup.parse() মেথড দিয়ে HTML কনটেন্ট পার্স করা হয়েছে।

সারাংশ

JSoup ব্যবহার করে HTML ফাইল লোড করা খুবই সহজ এবং সরল। Jsoup.parseFile() মেথড HTML ফাইল সরাসরি লোড করে পার্স করতে সাহায্য করে, আর Jsoup.parse() মেথড HTML কনটেন্ট স্ট্রিং আকারে প্রক্রিয়া করতে ব্যবহৃত হয়। এই দুইটি পদ্ধতি আপনার লোকাল বা রিমোট HTML ডকুমেন্ট থেকে ডেটা এক্সট্র্যাক্ট করার জন্য কার্যকর।

Content added By

Md Zahid Hasan

JSoup এর মাধ্যমে HTML ফাইল লোড করা String থেকে HTML লোড করা HTML ফাইল পার্সিং এর জন্য বিভিন্ন মেথড ব্যবহার করা

URL থেকে HTML ফাইল Fetch করা

HTML ফাইল লোড করার জন্য `Jsoup.parseFile()` ব্যবহার

উদাহরণ:

HTML ফাইল লোড করার জন্য `Jsoup.parse()` ব্যবহার

উদাহরণ:

সারাংশ

Promotion

Satt AI

Hi, আমি SATT AI!

URL থেকে HTML ফাইল Fetch করা

HTML ফাইল লোড করার জন্য Jsoup.parseFile() ব্যবহার

উদাহরণ:

HTML ফাইল লোড করার জন্য Jsoup.parse() ব্যবহার

উদাহরণ:

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!

HTML ফাইল লোড করার জন্য `Jsoup.parseFile()` ব্যবহার

HTML ফাইল লোড করার জন্য `Jsoup.parse()` ব্যবহার